資料集問題:
解決方法:
有兩種方法可以執行,可用python或下載exe執行,這邊我直接去官網下載exe來執行。
載完打開exe後,需要設定訓練集的路徑以及標記後的XML檔儲存路徑。
再來要設定自動儲存,勾選auto save。
用建好的YOLOv4模型來分類我們的資料集,主要會分為3類資料夾:
兩個字以上(多個框)
空白,沒文字
主辦單位說,正式比賽只會有一個清楚的字出現,故我們討論出,只針對一個字的資料夾去做處理及訓練,兩個字及沒有文字的資料夾則暫不處理。
在對一個字的資料夾做處理的時候發現其中有些問題:
標籤錯誤
解決:採取人工重新標籤
字體被切一半
解決:例如"洋"的圖片是羊,也是採取人工標籤為"羊"
字不在官方要的800字內
解決:利用python程式將標籤在非800字內的移入800字外的資料夾